سفارش تبلیغ
صبا ویژن
سه ویژگی در هر که باشد ایمانش به کمال رسد : خرد، بردباری و دانش . [امام علی علیه السلام]
لوگوی وبلاگ
 

آمار و اطلاعات

بازدید امروز :133
بازدید دیروز :178
کل بازدید :855980
تعداد کل یاداشته ها : 1319
103/9/9
6:32 ص
مشخصات مدیروبلاگ
 
آذر آموزش[45]
باسلام من در شغل تدریس کامپیوتر هستم و دراکثر شاخه های کامپیوتر فعالیت دارم

خبر مایه
لوگوی دوستان
 

منبع: روزنامه جام‌جم

رایانه سخنگو

برای تلفظ هوشمند عبارات، رایانه را وادار می‌کنیم تا صدای مورد نظر ما را تولید نماید. زمانی تصور اینکه انسان بتواند با رایانه خود صحبت کند و آن ماشین نیز صحبت او را متوجه شده و به او پاسخی از جنس صوت بدهد، غیر قابل باور بود؛ اما امروز با این که این امر به طور کامل محقق نشده است رسیدن به این پیشرفت دیگر غیر قابل باور نیست. در حال حاضر نرم‌افزار‌های بسیاری وجود دارند که می‌توان متن تایپ شده را تلفظ کند یا به عبارت دیگر متنی را بخواند. به این فناوری اصطلاحاً TTS یا text to speech گویند. نرم‌افزار‌هایی چون Babylon, Encarta, talkit  و ...  از این فناوری بهره گرفته‌اند.

روش چیدن اصوات

این امر به دو طریق قابل انجام است. یکی آنکه یک سری لغت و عبارت  پایه را توسط میکروفن در رایانه ضبط کنیم. سپس از طریق برنامه‌نویسی این اصوات را در جای مناسب خود و به ترتیب خاصی پخش کنیم. به عنوان مثال برای اعلام ساعت در یک برنامه می توان کلماتی مثل «یک»، «دو» و ...«یازده»، «دوازده» و ...«سی»، «چهل» و .. به همراه صدای «و» را ضبط کرد. سپس در زمان 32/11 به ترتیب 7 قطعه صوت «ساعت»- «یازده»- «و»-«سی»- «و»- «دو»- «دقیقه» را پخش کرد. این همان کاری است که در نرم‌افزار‌های ساعت گویا انجام می‌شود.

روش تولید صوت

اما روش دیگری نیز وجود دارد که کمی هوشمندانه‌تر است. در روش اول در صورتی که بخواهیم برنامه‌ای بنویسیم متن یک نامه را بخواند باید حجم زیادی از لغات را تلفظ کرده و در رایانه ضبط کنیم و با فرایندی زمان‌گیر یه ترتیب این لغات را پخش نمود. این کار برای کاری مشابه ساعت منطقی به نظر می‌رسد؛ اما برای کار اخیر بسیار وقت‌گیر، حجیم و پیچیده خواهد شد و در عین حال دیگر حالت طبیعی نخواهد داشت. به همین منظور از تکنیکهای تولید صوت استفاده می‌شود. در اینگونه  تکنیکها صدای هر حرف توسط دستورالعمل‌های پیچیده توسط کارت صوتی ساخته می‌شود. می‌توان گفت که با برنامه نویسی، کارت صدا را وادار به تلفظ حروف می‌کنیم. یکسری استثنائات  قواعد تلفظ را نیز جداگانه بهد این برنامه می‌آموزیم. مثلاً تلفظ "ch" در انگلیسی با "c" و "h" به طور جداگانه متفاوت است و یا در فارسی بعضی کلمات همچون «خواندن» یا «خواهر» و... «خوا» به صورت «خا» تلفظ می‌شود. با در نظر گرفتن این موارد نرم‌افزاری تهیه می‌شود که هر لغتی را اعم از با معنا یا بی‌معنا و یا اسامی را می‌توان تلفظ کند.

لهجه و نوع تلفظ

با اینکه تلفظ حرف «ب» در فارسی یا انگلیسی تفاوت ندارد اما حروف و کلماتی هستند که تلفظ آنها در زبانهای دیگر با زبان اصلی تفاوت دارد. به عنوان مثال کلمه «Math» در انگلیسی تلفظ خاصی دارد که معادل آن تلفظ در زبان فارسی وجود ندارد و آن مربوط به «th» است که تلفظی بین «ت» و «ث» است. البته این بدان معنا نیست که فارسی زبانان قادر به تلفظ آنها نیستند. یا تلفظ کلمه‌ای همچون «مخلوق» برای افراد انگلیسی زبان کمی مشکل و متفاوت است. وظیفه طراح این برنامه‌ها آن است که به این نکات توجه کنند. به همین دلیل نمی توان یک برنامه برای تلفظ کلیه متون در زبانهای مختلف تهیه کرد.

تکیه‌ها و شیوه بیان

اگر نرم‌افزاری به خواندن یک متن می‌پردازد، می‌بایست تا حد امکان به تکه‌های کلمات و جملات هم توجه داشته باشد. گاهی اوقات  تأکید روی یک کلمه از جمله معنای آنرا عوض می کند و یا تکیه نادرست بر روی یک حرف از کلمه آنرا دچار گویش کرده و درک آنرا مشکل می‌سازد. در ضمن برنامه باید با دیدن کلمات پرسشی یا علامت سؤال، جمله را به صورت سؤالی تلفظ کند. مشاهده می‌شود که پرداختن به تمامی این جوانب کاری آسان نیست اما از لحاظ سرعت و انعطاف‌پذیری در صورتی که برنامه‌ای با این قابلیت‌ها طراحی شد، از نوع اول بسیار کاراتر خواهد بود. زیرا اولاً هر عبارتی را می‌توان تلفظ کند  ثانیاً به علت استفاده از روشهای تلفظ بجای استفاده از تکه‌های تلفظ شده، سرعت بالاتری خواهد داشت. به این معنا که در ادای کلمات وقفه‌ای نخواهیم داشت مگر آنکه لازم باشد.

نرم‌افزار‌هایی با یان قابلیت به موتورهای متن به سخن معروفند. برای نمونه می‌توان موتور‌های متن به سخن شرکت مایکروسافت و IBM یا موتورهای ACUVOICE, DECTALK, AT&T و... اشاره کرد که می توان با استفاده از آنها به نرم‌افزار‌های کاربردی خصوصیت تلفظ داد.

پارسا ستوده‌نیا